Q: 我最早用curate来表达对llm的调教和管控,现在业界用harness engineering * **Harness Engineering(驾驭工程)**:Harness 的本意是“马具/挽具”(比如套在马身上用来拉车的皮带),或者指“驾驭自然力量”(如 Harness the power * **Harness Engineering** 是为了 **AI Agent(智能体)** 诞生的。 Harness Engineering 提供的是“状态持久化”、“错误阻断”和“多步规划的脚手架”。 ### 4. 工程化成熟度的区别:手工作坊 vs. * **Harness Engineering 本质上是把 DevOps 的思想引入到了 AI 领域**。
Harness Engineering 从 Prompt Engineering 到 Context Engineering,再到 Harness Engineering,AI 工程的重心,正在从 “怎么把话说对 这也是 Harness Engineering 开始被频繁提起的背景。 二、Harness Engineering 到底是什么 通俗来说,Harness Engineering 就是围绕 AI Agent 搭建一整套 “可执行、可验证、可约束、可迭代” 的外层运行系统。 三、Harness Engineering 与其他 Engineering 的核心区别 为了更好理解,我把三者放在一起对比: • Prompt Engineering(2022-2024 主流)主要优化单次交互的质量 四、Harness Engineering 的核心原理与落地实践 Harness Engineering 的底层逻辑并不复杂,它的关键不在于继续优化提示词,也不在于单纯扩展上下文,而是在模型之外搭建一套能够支撑
团队发布了一项震撼性的实验报告「Harnessengineering:leveragingCodexinanagent-firstworld」(https://openai.com/zh-Hans-CN/index/harness-engineering 发布官方博客的同一时期,Anthropic也发布了题为「Harnessdesignforlong-runningapplicationdevelopment」(https://www.anthropic.com/engineering HarnessEngineering的核心公式可以表达为「Agent=Model+Harness」,揭示了HarnessEngineering的本质:模型负责原始推理能力,而Harness负责除此之外的一切 Anthropic对Harness的定义更加简洁有力:「模型之外的一切」,所有的代码、配置、执行逻辑、约束规则、反馈回路,只要不是模型本身,都属于Harness的范畴。 这一定义明确了Harness的边界,将所有工程化可控的部分都纳入其中。
「把意图和规范写进仓库」,本身就是 Harness Engineering 的核心工作之一。 05 Harness Engineering 的具体启示 前面四节在回答「SDD 为什么有意义」。 这正是 Harness Engineering 的实质——也正是 SDD 在解决的问题。 构建 SDD 体系,不是在做一件和 Harness Engineering 平行的事,而是在回答 Harness Engineering 最核心的那个追问:究竟需要什么样的 scaffolding,才能让 OpenAI 工程团队 《Harness Engineering》官方博客文章,2026 年 2 月 https://openai.com/index/harness-engineering/ 关于本文的说明
OpenAI 最近发了一篇工程文章,题目是 Harness engineering: leveraging Codex in an agent-first world。
最近AI圈又流行起来一个新词:Harness Engineering,给AI套上缰绳的约束系统。
上一篇文章《Multi-Agent系统Harness Engineering架构的思考与实践》我们从 agent 与 MAS 的技术脉络、单 agent 到多 agent 的工程化边界、协调拓扑选择,结合 multi-agent项目实践整理,提出了一套针对multi-agent项目场景的harness engineering四层治理架构。 那Agent Harness与传统软件架构、平台工程到底是什么关系呢?如果不把这个关系说清楚,“agent harness engineering” 很容易被理解成一种把旧问题重新包装的新概念。 Agent Harness Engineering 的六个承重点 基于这个项目里的几轮收敛经验,以及前面提到的公开实践,暂且把这一类承重工程工作收束为 agent harness engineering , 2026. https://www.anthropic.com/engineering/harness-design-long-running-apps [30] OpenAI, Harness engineering
[27]Anthropic,Harnessdesignforlong-runningapplicationdevelopment,2026.https://www.anthropic.com/engineering .https://openai.com/index/harness-engineering/[31]Anthropic,ClaudeCodeautomode:asaferwaytoskippermissions ,2026.https://www.anthropic.com/engineering/claude-code-auto-mode[36]ClaudeCodeDocs,Automateworkflowswithhooks ,2025.https://learn.microsoft.com/en-us/platform-engineering/what-is-platform-engineering[16]MicrosoftLearn ,Self-servicewithguardrailstoempowerdevelopers,2025.https://learn.microsoft.com/th-th/platform-engineering
Harness架构设计之前,我们还有必要先厘清MAS核心的设计选择-协调拓扑。 考虑到MAS复杂度高于单agent,在MAS中生效的Harness工程架构应用范围可以覆盖单agent,所以后文提到的harness的架构设计都以MAS为基准进行设计知识供给层:不是仓库,是主动的信息生态定位 复盘后定位到的根因是:Harness工程上缺少多层次治理的解耦设计。 这正是三阶段演化能够成立的前提-不是因为模型越来越强就可以去掉Harness,而是因为Harness在,模型才可以将其决策推理应用到容错性更低,但价值更高的场景结语当下大模型和agent技术都发展飞快, building-effective-agentsAnthropic—BuildingAgentswiththeClaudeAgentSDK(2025)·https://www.anthropic.com/engineering
今天继续跟着我和Claude学习Harness Engineering驾驭者工程。这个我在前面就谈到了是AI编程工程化的一个重点,核心是让AI软件工程更加安全,可控,可靠的运行。 关于本文:本文基于对 Claude Code 六大核心维度的深度研究,从 Harness Engineering(驾驭工程)哲学视角重新审视 Claude Code 的设计逻辑。 Claude Code 被真正广泛采用的背后,是一套经过深思熟虑的设计哲学——Harness Engineering(驾驭工程)。 Harness Engineering Harness Engineering 的核心思想并非新鲜事物,但在 AI 工具时代获得了新的生命力。 Claude 这是 Harness Engineering 最具代表性的体现:复杂系统在无人值守时,依然在被结构化地驾驭运转,而非自由生长或停摆。
这不是魔法,这是一个正在被正式命名的工程实践:Harness Engineering。 一个月之内,Harness Engineering 从一篇博客文章变成了开发者社区的高频词。 Harness 到底在做什么 根据 OpenAI 官方报告的描述,Harness 由三个核心类别组成: 第一层:Context Engineering(上下文工程)。 Harness Engineering 代表的思维转变是:从「优化输入内容」到「优化系统环境」。 Prompt Engineering 关注的是「说什么」,Context Engineering 关注的是「给什么上下文」,而 Harness Engineering 关注的是「在什么条件下运行」。
(2025)→ Harness Engineering(2025+) 配了一句话让我想了挺久:「名词换了五六轮,核心问题从未改变——在不确定性上构建确定性。」 Harness Engineering 讲的是:不要靠提示词说服 AI 表现好,要靠工程框架约束 AI 的行为边界。 Harness Engineering 的核心洞察在这里就能用上:凡是你希望 AI「一定」做到的事,就不要靠提示词,要靠结构。 五、高风险操作前,停下来确认 Harness Engineering 里的「危险操作拦截」:涉及外部写入、数据删除、发送消息的操作,不能靠提示词约束,要在代码层做硬拦截。 七、最后 Harness Engineering 的核心洞察是:大多数 Agent 出问题,不是模型的问题,是脚手架的问题。
(2025)→ Harness Engineering(2025+)。 这也是为什么 Harness Engineering 这个词会出现——专门描述"围绕模型的那层工程壳"。 今天从 Harness Engineering 的视角重新看一遍,你会发现 OpenClaw 其实是一个教科书级的 Harness 实现。 这是 Harness Engineering 的第二条原则:让模型的初始状态可重现,而不是随机的。 这是 Harness 设计的第三条原则:给模型最小化、最精确的能力集。 四、Android 上的 Harness Engineering 说完原理,说实践。
Harness Engineering:AI 原生软件开发的未来范式与职业指南 从"写代码"到"驾驭智能体",软件工程正在经历自图形界面诞生以来最深刻的变革。 一、什么是 Harness Engineering? Engineering 任务指挥官 虚拟工程师团队 5-10 倍 1.3 为什么叫"Harness"? (提示工程) ↓ 2025: Context Engineering(上下文工程) ↓ 2026+: Harness Engineering(驾驭工程) ↓ 2027+: Agent 8.2 时间窗口 时间 状态 2026 年 Harness Engineering 技能成为区分度 2027 年 成为主流研发模式 2028 年 不会 Harness Engineering 的工程师面临淘汰风险
— Anthropic Engineering在 Harness Engineering 中,我们将这个二元对立推广为一个六智能体流水线: Harness Engineering 的解决方案是全链路实时流式可观测性。 在 Harness Engineering 中,这意味着插件生态不仅服务于「生成过程」,也应该服务于「生成结果」。 在 Harness Engineering 的实践中,我们学到了几个深刻的教训:架构比模型更重要。 这才是 Harness Engineering 的终极命题
他们总结的最重要教训之一:prompt比harness更重要,约束比指令更有效。翻译成人话就是——你定义得越清楚,AI犯的错越少。你不搞流程,AI不会帮你搞。
Agent Harness 的解剖结构 概述 Agent Harness 是一个用于构建、测试和部署语言模型代理的框架。 实现健壮的错误处理和恢复机制 性能优化:缓存常用结果,减少不必要的调用 监控和日志:实现全面的监控和日志记录 应用场景 客户服务自动化 数据分析与报告 代码生成和审查 研究辅助 工作流程自动化 总结 Agent Harness
Harness Engineering的基础概念 基于此,OpenAI 提出了一个关键词叫“Harness Engineering”,即“驾驭者工程”。 “Harness”这个词如果单纯从英文解释,它有两个含义: 一个是名词,指马具、马鞍;另一个是动词,指驾驭、控制。 那么什么叫“Harness”驾驭者工程呢? 很简单,就是给这匹马装了马鞍,套上了缰绳,相关的道路旁边修建了围栏,这个加起来就是“Harness”。为什么加了这些东西? Harness Engineering的核心内容 再展开一点,驾驭者工程在传统 AI 编程、上下文工程的基础上,究竟增加了哪一些关键的内容? 第一个,我把它理解为“架构约束、架构可控”。 好了,今天关于 Harness 相关的分享就到这里。 希望对大家有所启发,再见。
AI 圈最近又冒出了一个新词,叫:Harness Engineering 短短几天这个词就刷遍了各种 AI 社群、技术博客、和开发者讨论区。 问题是这一次的 Harness Engineering 并不是一个简单的包装词,它背后指向的是AI系统落地过程里一个越来越核心的现实问题。 今天这期内容我就想把三个概念一次讲透: Prompt Engineering 、Context Engineering 和 Harness Engineering, 讲清楚它们各自解决什么问题,彼此是什么关系 这时候Harness Engineering才真正登场。 • Context Engineering 解决的是信息供给。 • Harness Engineering 解决的是执行可靠性。 它们不是替代关系,而是层层嵌套的关系。
这就是Context Engineering,它管的是信息。主要负责的是信息往哪存、怎么取、怎么精选。它们不管流程,金鱼模型拿到记事本之后到底有没有去翻,翻完了有没有按上面写的做,做完了有没有人验收。 一开始他们按照 Context Engineering 的思路搭了第一版工作框架。做法分两步走。先派一个 Agent 负责开局,分析需求、拆出 200 多个功能点、生成一份结构化清单。 Context Engineering 的最佳实践也照做了。听起来合理。但实际跑起来,全面溃败。他们发现了这里存在四种失败模式。第一种,提前交卷。 在《Harness engineering: leveraging Codex in an agent-first world》(2026 年 2 月)中,他们从 2025 年 8 月的一个空仓库开始做了一场实验 如果每一层补偿都是临时的,那 harness engineering 本身是不是也是临时的?没有人回答。但这个问题存在本身就是信号。